meca1.png
meca2.png


Se ha desarrollado toda una seria de mecanismos de procesamiento paralelo en computadoras monoprocesadores, la cual es clasificada en 6 categorías:

Multiplicidad de unidades funcionales


Las primeras unidades disponían de una sola unidad aritmética-lógica en el CPU. Antes la el __ALU__, solo podía procesar una función a la vez, siendo el proceso demasiado lento para ejecutar una larga secuencia de instrucciones. Pero muchas funciones de la ALU pueden estas distribuidas sobre múltiples unidades funcionales especializadas, que pueden estar en paralelo. Por ejemplo: CDC-6600, es un procesador diseñado en 1964, este tiene 10, unidades funcionales incorporadas en el CPU. Estas unidades son independientes entre sí y pueden operar simultáneamente. Este emplea un marcador para registrar la disponibilidad de las unidades funcionales y registros que se soliciten. Otro ejemplo es el monoprocesador multifunción de IBM 360/91 (168), que dispone de dos unidades de ejecución paralelo, estas son una aritmética en coma fija y otra aritmética en coma flotante, que esta otra, existen dos unidades más, una para suma-resta y otra para división-multiplicación. Este procesador es altamente encauzado.



cdc.gif

Paralelismo de segmentación encauzada (solapamiento) dentro de un CPU


Las diferentes de ejecución entre las que se incluyen la extracción de la instrucción, su decodificación, la extracción del operando, la ejecución, aritmético-lógica y el almacenamiento del resultado. Estas etapas o segmentos se conectan en cascada formando un cauce. Para facilitar las ejecuciones solapadas de instrucciones a través del cauce, se han desarrollado técnicas de pre extracción de instrucción y de de memorización intermedia de datos. La mayoría de los sistemas mono procederes comerciales están hoy día encauzados en la CPU con un periodo de reloj entre 10 y 500 nano segundos.

Solapamiento de operaciones de CPU y de E/S


Las operaciones de de E/S, pueden ejecutarse simultáneamente con los cálculos de CPU utilizando controladores de E/S, canales o procesadores de E/S separados. El canal de acceso directo a la memoria, puede ser utilizado para permitir trasferir directa de información entre los dispositivos de E/S y la memoria principal. Este trabaja mediante el robo de ciclos a la CPU. Además, el multiprocesamiento de la E/S se puede elevar la velocidad e transferir de transferencia de datos entre la CPU o memoria y el mundo externo.

Image1347.gif

Uso de sistemas jerárquico de memoria


Se puede utilizar un sistema jerárquico de memoria para acortar la diferencia de velocidad. El nivel mas interno es el de las filas de registros directamente direccionales en por la ALU. La memoria cache puede utilizarse como memoria intermedia entre el CPU y l memoria principal. El acceso a la memoria principal por bloques puede conseguirse mediantes entrelazado multi-vía que utiliza módulos de memoria en paralelo. El espacio de memoria virtual puede utilizarse como ayuda de memoria de disco en los niveles exteriores.



piramida_de_memoria.gif


Equilibrando de los anchos de banda de los subsistemas


En general, la CPU es la unida más rápida de un computador, con ciclos de procesador, decenas de nanosegundos, donde la memoria principal tiene un tiempo de ciclo y los sistemas de E/S son lo más lentos con el tiempo de acceso medio de varios.

El ancho de banda de un sistema se define como el número de operaciones efectuada por unidad de tiempo. En el caso de un sistema de memoria principal, el ancho de banda se mide por el número del tamaño de la palabra de memoria que puede ser accedida por unidad de tiempo.



atrás.pngsiguiente.png